Capítulo 4 


ALGORITMOS ÁVIDOS 


4.1 INTRODUCCIÓN 


El método que produce algoritmos ávidos es un método muy sencillo y que puede 
ser aplicado a numerosos problemas, especialmente los de optimización. 


Dado un problema con n entradas el método consiste en obtener un subconjunto 
de éstas que satisfaga una determinada restricción definida para el problema. Cada 
uno de los subconjuntos que cumplan las restricciones diremos que son soluciones 
prometedoras. Una solución prometedora que maximice o minimice una función 
objetivo la denominaremos solución óptima. 


Como ayuda para identificar si un problema es susceptible de ser resuelto por 
un algoritmo ávido vamos a definir una serie de elementos que han de estar 
presentes en el problema: 


n conjunto de candidatos, que corresponden a las n entradas del problema. 


U 
Una función de selección que en cada momento determine el candidato idóneo 
para formar la solución de entre los que aún no han sido seleccionados ni 
rechazados. 

e Una función que compruebe si un cierto subconjunto de candidatos es 
prometedor. Entendemos por prometedor que sea posible seguir añadiendo 
andidatos y encontrar una solución. 

e Una función objetivo que determine el valor de la solución hallada. Es la 
función que queremos maximizar o minimizar. 


e Una función que compruebe si un subconjunto de estas entradas es solución al 
problema, sea óptima o no. 


Con estos elementos, podemos resumir el funcionamiento de los algoritmos 
ávidos en los siguientes puntos: 


1. Para resolver el problema, un algoritmo ávido tratará de encontrar un 
subconjunto de candidatos tales que, cumpliendo las restricciones del problema, 
constituya la solución óptima. 


2. Para ello trabajará por etapas, tomando en cada una de ellas la decisión que le 
parece la mejor, sin considerar las consecuencias futuras, y por tanto escogerá 
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de entre todos los candidatos el que produce un óptimo local para esa etapa, 
suponiendo que será a su vez óptimo global para el problema. 


3. Antes de añadir un candidato a la solución que está construyendo comprobará si 
es prometedora al añadilo. En caso afirmativo lo incluirá en ella y en caso 
contrario descartará este candidato para siempre y no volverá a considerarlo. 


4. Cada vez que se incluye un candidato comprobará si el conjunto obtenido es 
solución. 


Resumiendo, los algoritmos ávidos construyen la solución en etapas sucesivas, 
tratando siempre de tomar la decisión óptima para cada etapa. A la vista de todo 
esto no resulta difícil plantear un esquema general para este tipo de algoritmos: 


PROCEDURE AlgoritmoAvido(entrada: CONJUNTO) : CONJUNTO; 
VAR x:ELEMENTO; solucion:CONJUNTO; encontrada: BOOLEAN; 
BEGIN 
encontrada:=FALSE; crear(solucion); 
WHILE NOT EsVacio(entrada) AND (NOT encontrada) DO 
x:=SeleccionarCandidato (entrada) ; 
IF EsPrometedor(x,solucion) THEN 
Incluir(x,solucion); 
IF EsSolucion(solucion) THEN 
encontrada : =TRUE 
END; 
END 
END; 
RETURN solucion; 
END AlgoritmoAvido; 


De este esquema se desprende que los algoritmos ávidos son muy fáciles de 
implementar y producen soluciones muy eficientes. Entonces cabe preguntarse 
¿por qué no utilizarlos siempre? En primer lugar, porque no todos los problemas 
admiten esta estrategia de solución. De hecho, la búsqueda de óptimos locales no 
tiene por qué conducir siempre a un óptimo global, como mostraremos en varios 
ejemplos de este capítulo. La estrategia de los algoritmos ávidos consiste en tratar 
de ganar todas las batallas sin pensar que, como bien saben los estrategas militares 
y los jugadores de ajedrez, para ganar la guerra muchas veces es necesario perder 
alguna batalla. 


Desgraciadamente, y como en la vida misma, pocos hechos hay para los que 
podamos afirmar sin miedo a equivocarnos que lo que parece bueno para hoy 
siempre es bueno para el futuro. Y aquí radica la dificultad de estos algoritmos. 
Encontrar la función de selección que nos garantice que el candidato escogido o 
rechazado en un momento determinado es el que ha de formar parte o no de la 
solución óptima sin posibilidad de reconsiderar dicha decisión. Por ello, una parte 
muy importante de este tipo de algoritmos es la demostración formal de que la 
función de selección escogida consigue encontrar óptimos globales para cualquier 
entrada del algoritmo. No basta con diseñar un procedimiento ávido, que seguro 
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que será rápido y eficiente (en tiempo y en recursos), sino que hay que demostrar 
que siempre consigue encontrar la solución óptima del problema. 


Debido a su eficiencia, este tipo de algoritmos es muchas veces utilizado aun en 
los casos donde se sabe que no necesariamente encuentran la solución óptima. En 
algunas ocasiones la situación nos obliga a encontrar pronto una solución 
razonablemente buena, aunque no sea la óptima, puesto que si la solución óptima 
se consigue demasiado tarde, ya no vale para nada (piénsese en el localizador de un 
avión de combate, o en los procesos de toma de decisiones de una central nuclear). 
También hay otras circunstancias, como veremos en el capítulo dedicado a los 
algoritmos que siguen la técnica de Ramificación y Poda, en donde lo que interesa 
es conseguir cuanto antes una solución del problema y, a partir de la información 
suministrada por ella, conseguir la óptima más rápidamente. Es decir, la eficiencia 
de este tipo de algoritmos hace que se utilicen aunque no consigan resolver el 
problema de optimización planteado, sino que sólo den una solución “aproximada”. 


El nombre de algoritmos ávidos, también conocidos como voraces (su nombre 
original proviene del término inglés greedy) se debe a su comportamiento: en cada 
etapa “toman lo que pueden” sin analizar consecuencias, es decir, son glotones por 
naturaleza. En lo que sigue veremos un conjunto de problemas que muestran cómo 
diseñar algoritmos ávidos y cuál es su comportamiento. En este tipo de algoritmos 
el proceso no acaba cuando disponemos de la implementación del procedimiento 
que lo lleva a cabo. Lo importante es la demostración de que el algoritmo encuentra 
la solución óptima en todos los casos, o bien la presentación de un contraejemplo 
que muestra los casos en donde falla. 


4.2 EL PROBLEMA DEL CAMBIO 


Suponiendo que el sistema monetario de un país está formado por monedas de 
valores v;,V»,...,Vy, €l problema del cambio de dinero consiste en descomponer 
cualquier cantidad dada M en monedas de ese país utilizando el menor número 
posible de monedas. 


En primer lugar, es fácil implementar un algoritmo ávido para resolver este 
problema, que es el que sigue el proceso que usualmente utilizamos en nuestra vida 
diaria. Sin embargo, tal algoritmo va a depender del sistema monetario utilizado y 
por ello vamos a plantearnos dos situaciones para las cuales deseamos conocer si el 
algoritmo ávido encuentra siempre la solución óptima: 


a) Suponiendo que cada moneda del sistema monetario del país vale al menos el 
doble que la moneda de valor inferior, que existe una moneda de valor unitario, 
y que disponemos de un número ilimitado de monedas de cada valor. 


b) nO que el sistema monetario está compuesto por monedas de valores 1, 
P,p",p”,.... p", donde p > 1 y n > 0, y que también disponemos de un número 
ilimitado de monedas de cada valor. 


Solución (és) 


Comenzaremos con la implementación de un algoritmo ávido que resuelve el 
problema del cambio de dinero: 
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TYPE MONEDAS =(M500,M200,M100,M50,M25,M5,M1); (*sistema monetariox) 
VALORES = ARRAY MONEDAS OF CARDINAL; (* valores de monedas x*x) 
SOLUCION = ARRAY MONEDAS OF CARDINAL; 


PROCEDURE Cambio(n:CARDINAL;VAR valor: VALORES;VAR cambio: SOLUCION) ; 
(* n es la cantidad a descomponer, y el vector "valor" contiene los 
valores de cada una de las monedas del sistema monetario x) 
VAR moneda: MONEDAS; 
BEGIN 
FOR moneda: =FIRST(MONEDAS) TO LAST(MONEDAS) DO 
cambio [moneda] :=0 
END; 
FOR moneda:=FIRST(MONEDAS) TO LAST(MONEDAS) DO 
WHILE valor[moneda]<=n DO 
INC(cambio[moneda]); 
DEC (n,valor [moneda] ) 
END 
END 
END Cambio; 


Este algoritmo es de complejidad lineal respecto al número de monedas del país, 
y por tanto muy eficiente. 


Respecto a las dos cuestiones planteadas, comenzaremos por la primera. 


Supongamos que nuestro sistema monetario esta compuesto por las siguientes 
monedas: 


TYPE MONEDAS = (M11,M5,M1); valor:=411,5,1); 


Tal sistema verifica las condiciones del enunciado pues disponemos de moneda 
de valor unitario, y cada una de ellas vale más del doble de la moneda 
inmediatamente inferior. 


Consideremos la cantidad n = 15. El algoritmo ávido del cambio de monedas 
descompone tal cantidad en: 


l5=11+1+1+1>+1, 
es decir, mediante el uso de cinco monedas. Sin embargo, existe una 
descomposición que utiliza menos monedas (exactamente tres): 
15=5+5+5. 


Aunque queda comprobado que bajo estas circunstancias el diseño ávido no 
puede utilizarse, las razones por las que el algoritmo falla quedarán al descubierto 
cuando analicemos el siguiente punto. 


b) En cuanto a la segunda situación, y para demostrar que el algoritmo ávido 
encuentra la solución óptima, vamos a apoyarnos en una propiedad general de los 
números naturales: 
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Si p es un número natural mayor que 1, todo número natural x puede expresarse 
de forma única como: 


X=" +Trip7 rap? rá ERDS [4.1] 


con 0 < r,< p para todo 0 < ¡< n y siendo n el menor natural tal que x < p”*, es 


decir, n = Llog,x. 

El algoritmo del cambio de monedas lo que hace en nuestro caso es calcular los 
r;, que indican el número de monedas a devolver de valor p' (0 < ¡<n). Lo que 
tenemos que demostrar es que esa descomposición es óptima, esto es, que si 


xX=SQESp ESP +. Esp” 
es otra descomposición distinta, entonces: 


m 


n 
En<Ys. 
i=0 i=0 


Para realizar esta demostración lo haremos primero para p = 2 porque 
intuitivamente resulta más sencillo de entender el proceso de la demostración. El 
caso general resulta ser análogo. 


Sea entonces 


x= +2 +2 +. +27, [4.2] 


Si ' . nos 1 

la descomposición obtenida por el algoritmo ávido. Por tanto x < 2”” y los 
coeficientes r; toman los valores 0 ó 1. Consideremos además otra descomposición 
distinta: 


x=s0 +28 +22 +0. 42" Sm 
Paso 1: 
En primer lugar, como se verifica que x < 2”*!, esto implica que m < n. 


Definimos entonces S+1 = Sm+2 = ... = Sn = O para poder disponer de n términos en 
cada descomposición. 


Paso 2: 


Queremos ver que 
TQ FT¡F.. FT <SQ FS +... Sp. 


Como ambas descomposiciones son distintas, sea k el primer índice tal que 
Ti + Si Podemos suponer sin perder generalidad que k = 0, puesto que si no lo fuera 
podríamos restar a ambos lados de la desigualdad los términos iguales y dividir por 
la potencia de 2 adecuada. Veamos que si ro + syentonces ro < So. 


e Si xes par entonces ry= 0. Como sy> O y estamos suponiendo que ry + So, So ha 
de ser mayor que cero y por tanto podemos deducir que ro < so. 
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e Si xes impar entonces ry= 1. Pero en la segunda descomposición de x también 
ha de haber al menos una moneda de una unidad, y por tanto so> 1. Al estar 
suponiendo que ro + So, podemos deducir también aquí que ro < so. 


Con esto, consideremos la cantidad sy— rp > 0. Tal cantidad ha de ser par pues 
x —Tolo es (por la expresión [4.2]). Y por ser par, siempre podremos “mejorar” la 
segunda descomposición (sp,s1,...,S,) cambiando sy — rg monedas de 1 unidad por 
(so— 7o)/2 monedas de 2 unidades, obteniendo: 


Sy 7% 
Sota 2 les. +, [4.3] 
Paso 3: 


Mediante el razonamiento anterior hemos obtenido una nueva descomposición, 
mejor que la segunda, y manteniendo además que: 


So =% 


mts pers a tn2e 02. 


Podemos volver a aplicar el razonamiento del paso 2 sobre esta nueva 
descomposición, y así sucesivamente ir viendo que s;> r; para todo 0<i<n-1, e ir 
obteniendo nuevas descomposiciones, cada una mejor que la anterior, hasta llegar 
en el último paso a una descomposición de la forma: 


A a E [4.4] 
2 


en la que hemos ido acumulando las diferencias en el último término, y que además 
verifica que: 


y 57 acum, 


A > 


Jr. APR A AOS ei) 


Una vez llegado a este punto la demostración está ya realizada, puesto que si se 
verifica [4.4], por la unicidad de la descomposición a la que hacía referencia la 
propiedad [4.1], se ha de cumplir que 


y esto, junto a la cadena de desigualdades [4.3], hace que sea cierta nuestra 
afirmación. Para el caso p > 2 el razonamiento es igual. 


Resta sólo preguntarnos por qué esta demostración no funciona para cualquier 
sistema monetario. La razón fundamental se encuentra en la expresión [4.4], que en 
este sistema permite pasar monedas de una unidad a otra sin problemas, no siendo 
válido para todos. 
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4.3 RECORRIDOS DEL CABALLO DE AJEDREZ 


Dado un tablero de ajedrez y una casilla inicial, queremos decidir si es posible que 
un caballo recorra todos y cada uno de los escaques sin duplicar ninguno. No es 
necesario en este problema que el caballo vuelva al escaque de partida. Un posible 
algoritmo ávido decide, en cada iteración, colocar el caballo en la casilla desde la 
cual domina el menor número posible de casillas aún no visitadas. 


a) Implementar dicho algoritmo a partir de un tamaño de tablero nxn y una casilla 
inicial (xo,yo). 


b) Buscar, utilizando el algoritmo realizado en el apartado anterior, todas las 
casillas iniciales para los que el algoritmo encuentra solución. 


c) Basándose en los resultados del apartado anterior, encontrar el patrón general de 
las soluciones del recorrido del caballo. 


Solución (9/09) 


a) Para implementar el algoritmo pedido comenzaremos definiendo las constantes y 
tipos que utilizaremos: 


CONST TAMMAX «3 Ge dimension maxima del tablero *) 
TYPE tablero = ARRAY[1..TAMMAX], [1..TAMMAX] OF CARDINAL; 


Cada una de las casillas del tablero va a almacenar un número natural que indica 
el número de orden del movimiento del caballo en el que visita la casilla. Podrá 
tomar también el valor cero, indicando que la casilla no ha sido visitada aún. 
Inicialmente todas las casillas tomarán este valor. 

Una posible implementación del algoritmo viene dada por la función Caballo 
que se muestra a continuación, la cual, dado un tablero f, su dimensión n y una 
posición inicial (x,y), decide si el caballo recorre todo el tablero o no. 


PROCEDURE Caballo(VAR t:tablero; n:CARDINAL; x,y:CARDINAL) : BOOLEAN; 
VAR i:CARDINAL; 

BEGIN 
InicTablero(t,n); (* inicializa las casillas del tablero a O x*) 
FOR i:=1 TO n*n DO 


tlx,yl:=i; 
IF NOT NuevoMov(t,n,x,y) AND (i<n*n-1) THEN RETURN FALSE END; 
END; 


RETURN TRUE; (* hemos recorrido las n*n casillas *x) 
END Caballo; 


La función NuevoMov es la que va a ir calculando la nueva casilla a la que salta 
el caballo siguiendo la indicación del enunciado, devolviendo FALSE si no puede 
moverse: 


PROCEDURE NuevoMov(VAR t:tablero; n:CARDINAL; VAR x,y:CARDINAL) 
: BOOLEAN; 
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VAR accesibles, minaccesibles:CARDINAL; 
i,solx,soly,nuevax,nuevay: CARDINAL; 
BEGIN 
minaccesibles:=9; 
solx:=x; soly:=y; 
FOR i:=1 TO 8 DO 
IF Salto(t,n,i,x,y,nuevax,nuevay) THEN 
accesibles:=Cuenta(t,n,nuevax,nuevay); 
IF (accesibles>0) AND (accesibles<minaccesibles) THEN 
minaccesibles:=accesibles; 


solx:=nuevax; soly:=nuevay; 
END 
END 
END; 
x:=solx; y:=soly; 
RETURN (minaccesibles<9); 
END NuevoMov; 


Para su implementación necesitamos dos funciones auxiliares: Salto y Cuenta. 
La primera calcula las coordenadas de la casilla a donde salta el caballo (tiene 8 
posibilidades), y devuelve si es posible realizar ese movimiento o no (puede estar 
ocupada o bien salirse del tablero): 


PROCEDURE Salto(VAR t:tablero;n:CARDINAL;i:CARDINAL; 
x,y:CARDINAL;VAR nx,ny:CARDINAL) :BOOLEAN; 
(* i indica el numero del movimiento, (x,y) es la casilla 
actual, y (nx,ny) es la casilla a donde salta. *) 
BEGIN 
CASE i OF 
|1: nx:=x-2; ny:=y+1; 12: nx:=x-1; ny:=y+2; 
13: nx:=x+1; ny:=y+2; |4: nx:=x+2; ny:=y+1; 
15: nx:=x+2; ny:=y-1; |6: nx:=x+1; ny:=y-2; 
|7: nx:=x-1; ny:=y-2; 18: nx:=x-2; ny:=y-1; 
END; 
RETURN ( (1<=nx) AND (nx<=n) AND (1<=ny) AND (ny<=n) AND (t [nx,ny]=0)) ; 
END Salto; 


Dicha función intenta los movimientos en el orden que muestra la siguiente 
figura: 
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La otra función es Cuenta, que devuelve el número de casillas a las que el 
caballo puede saltar desde una posición dada: 


PROCEDURE Cuenta(VAR t:tablero;n:CARDINAL;x,y:CARDINAL) : CARDINAL; 
VAR acc,i,nx,ny:CARDINAL; 
BEGIN 
acc:=0; 
FOR i:=1 TO 8 DO 
IF Salto(t,n,i,x,y,nx,ny) THEN INC(acc) END 
END; 
RETURN acc; 
END Cuenta; 


Obsérvese que hemos utilizado el paso del tablero por referencia (mediante 
VAR) en vez de por valor en todos los procedimientos aunque no se modifique el 
vector, para evitar su copia en la pila. 


b) Para resolver esta cuestión necesitamos un programa que nos permita ir 
recorriendo todas las posibilidades e imprimiendo aquellas casillas iniciales desde 


donde se consigue solución: 
MODULE Caballos; 


VAR t:tablero; n,i,j:CARDINAL; 
BEGIN 
FOR n:=4 TO TAMMAX DO 
WrStr('Dimension = *); WrCard(n,0); WrLnO ; 
FOR i:=1 TO n DO FOR j:=1 TO n DO 
IF Caballo(t,n,i,j) THEN 
WrStr( Desde: *); WrCard(i,0); WrStr(“,?); 
WrCard(j,0); WrStr( tiene solucion.?); WrLn() ; 
END 
END END; 
WrlnO ; 
END 
END Caballos. 
c) La salida del programa anterior nos permite inferir un patrón general para las 
soluciones del problema: 


e Para n=4, el problema no tiene solución. 
e Paran> 4, n par, el problema tiene solución para cualquier casilla inicial. 
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e Para n > 4, n impar, el problema tiene solución para aquellas casillas iniciales 
(o,Yo) que verifiquen que xo + yo sea par, es decir, si el caballo comienza su 
recorrido en una escaque blanco. 


Pero observemos que el algoritmo implementado no ha encontrado solución en 
todas estas situaciones. Por ejemplo, para n =5,xp=5 e yo= 3 el programa dice 
que no la hay. Sin embargo, sí la encuentra para n=5,xp= 1 e yo=3, para n= 5, xo 
=3 e yo= 1 y para n= 5, x0=3 e yo = 5, que son casos simétricos. De existir 
solución para alguno de ellos, por simetría se obtiene para los otros. ¿Por qué no la 
encuentra nuestro algoritmo? 


La respuesta a esta pregunta se encuentra en cómo buscamos la siguiente casilla 
a donde saltar. Por la forma en la que funciona el programa, siempre probamos las 
ocho casillas en el sentido de las agujas del reloj, siguiendo la pauta mostrada en la 
función Salto. Esto hace que nuestro algoritmo no sea simétrico. En resumen, 
estamos ante un algoritmo ávido que no funciona para todos los casos. 


4.4 LA DIVISIÓN EN PÁRRAFOS 


Dada una secuencia de palabras p, p», ..., p, de longitudes /;, l», ..., l, se desea 
agruparlas en líneas de longitud £. Las palabras están separadas por espacios cuya 
amplitud ideal (en milímetros) es b, pero los espacios pueden reducirse o ampliarse 
si es necesario (aunque sin solapamiento de palabras), de tal forma que una línea p,, 
Pis1» -., py tenga exactamente longitud L. Sin embargo, existe una penalización por 
reducción o ampliación en el número total de espacios que aparecen o desaparecen. 
El costo de fijar la línea p;, p;+1, .... p; es (¡ — ¿)|b” — b|, siendo b” el ancho real de los 
espacios, es decir (L — l;— ls — ... — I)/G — 1). No obstante, si ¡ = n (la última 
palabra) el costo será cero a menos que b” < b (ya que no es necesario ampliar la 
última línea). 

En primer lugar, necesitamos plantear un algoritmo ávido para resolver el 
problema, implementarlo y dar un ejemplo donde este algoritmo no encuentre 
solución óptima o bien demostrar que tal ejemplo no existe. 


Por otra lado, consideraremos el caso especial de usar una impresora de líneas, 
en donde por sus caracteristicas especiales el valor óptimo de b es 1 y no se puede 
producir reducción de espacios (ya que b no puede ser 0). 


Solución (O) 


Para resolver este problema mediante un algoritmo ávido pensemos en lo que 
haríamos en la práctica para solucionarlo. En primer lugar, iríamos construyendo la 
línea empezando por la primera palabra y añadiendo las demás en orden, 
separándolas con espacios de tamaño óptimo b, hasta llegar a una palabra p, (a>1) 
que no quepa en la línea, es decir: 


ED ERES, 


Si ocurriera que /, + by+ ... + Ll, + (a—1)*b = L, esto es, que la palabra encajara 
perfectamente en la línea, sencillamente imprimiríamos la línea y continuaríamos 
con la siguiente. Pero si no, necesitaríamos tomar una decisión: o se comprimen las 
palabras p,,....Pa-1 (recortando el tamaño de los espacios que las separan) para que 
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pueda caber también p, en la línea; o bien se pasa la palabra p, a la siguiente línea 
y se imprime la línea en curso, aumentando antes los espacios entre las palabras 
P1»...Pa-1 para que la línea tenga exactamente longitud L£. 


El algoritmo ávido simplemente va a escoger aquella opción que suponga un 
menor coste. Obsérvese que estamos ante un típico algoritmo ávido, pues siempre 
toma su decisión basado en una optimización local y nunca “guarda historia”. 


Para implementar tal algoritmo, vamos a disponer de un vector que almacena las 
longitudes de las palabras, y la solución vamos a darla como un vector de registros, 
uno por cada línea. Cada registro contiene los índices (número de orden) de las 
palabras que comienzan y terminan la línea, el tamaño de los espacios entre las 
palabras y el coste de la línea. Esto da lugar al siguiente algoritmo: 


CONST MAXPALABRAS LES 
MAXLINEAS MAXPALABRAS; (* para cubrir el peor caso *) 
TYPE REGISTRO= RECORD 
primera,ultima: CARDINAL; 
espacio,coste:REAL; 
END; 
SOLUCION= ARRAY [1..MAXLINEAS] OF REGISTRO; 
LONGPALS= ARRAY [1..MAXPALABRAS] OF CARDINAL; 


PROCEDURE Parrafo(L:CARDINAL;n:CARDINAL;b:CARDINAL;VAR 1:LONGPALS; 
VAR sol: SOLUCION) : CARDINAL; 

(x* L es la longitud de la linea, n el numero de palabras, b el 
tamano optimo de los espacios, 1 es el vector con las 
longitudes de las n palabras, y en sol almacena la solucion. 
Devuelve el numero de lineas que ha necesitado *) 


VAR  tamanopalabras:CARDINAL; (* long de palabras de la linea *) 
tamanolinea: CARDINAL; (* tamano de la linea en curso *) 


nlinea: CARDINAL; (* linea en curso *) 
npalabra: CARDINAL; (* palabra en curso *) 
nespacios: CARDINAL; (* num. espacios linea en curso *) 


PROCEDURE Espacio(L,tampalabras,nesp: CARDINAL) :REAL; 
(* devuelve cero si nesp = 0, o bien un numero mayor que 1 *) 
BEGIN 
IF nesp=0 THEN RETURN 0.0 END; 
RETURN REAL (L-tampalabras)/REAL (nesp) ; 
END Espacio; 


PROCEDURE ResetContadores (linea,npal : CARDINAL) ; 
BEGIN 
IF npal<=n THEN (* para la ultima palabra no hacemos nada *) 
sol [linea] .primera:=npal; 
sol [linea] .coste:=0.0; 
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tamanopalabras:=1[npal]; 
tamanolinea:=1[npal]; 
nespacios:=0 
END; 
END ResetContadores; 


PROCEDURE Coste(L,b,tampalabras,nesp: CARDINAL) :REAL; 
VAR bprima:REAL; 
BEGIN 
bprima:=Espacio(L,tampalabras,nesp); 
IF bprima>REAL(b) THEN RETURN REAL (nesp)* (bprima-REAL(b) ) 
ELSE RETURN REAL (nesp)*(REAL(b) -bprima) 
END; 
END Coste; 


PROCEDURE CerrarLinea(linea,npal: CARDINAL); 
BEGIN 
sol [lineal .ultima:=npal-1; 
sol [lineal .espacio:=Espacio(L,tamanopalabras,nespacios); 
sol [lineal] .coste:=Coste(L,b,tamanopalabras,nespacios); 
END CerrarLinea; 
BEGIN (* programa principal del procedimiento Parrafo *) 
nlinea:=1; 
ResetContadores (nlinea,1); (* metemos la primera palabra *) 
npalabra:=2; 
WHILE (npalabra<=n) DO 
IF tamanolinea+b+1[npalabra]<=L THEN (* cabe *) 
INC(tamanolinea,b+1[npalabra]) ; 
INC(tamanopalabras,1[npalabra]); 
INC(nespacios) 
ELSE  (* no cabe de forma optima *) 
IF (tamanopalabras+1[npalabra]+nespacios+1)>L THEN 
(* no cabe en cualquier caso: la pasamos a otra linea *) 
CerrarLinea (nlinea,npalabra) ; 
INC (nlinea) ; (* reinicializamos contadores *) 
ResetContadores (nlinea,npalabra) ; 
ELSE (* podria caber. Tenemos que tomar una decision *) 
IF Coste(L,b,tamanopalabras,nespacios)>= 
Coste(L,b,tamanopalabras+1[npalabral ,nespacios+1) THEN 
INC(npalabra);  (* la metemos en la linea en curso *) 
END; 
(* si no, la pasamos a la otra linea *) 
CerrarLinea(nlinea,npalabra) ; 
INC (nlinea) ; 
ResetContadores (nlinea,npalabra) ; 
END 


ALGORITMOS ÁVIDOS 153 


END; 
INC (npalabra) ; 
END; 
IF sol[nlinea].primera=0 THEN RETURN nlinea-1 END; 
IF sol[nlinea] .ultima=0 THEN CerrarLinea(nlinea,npalabra) END; 
RETURN nlinea; 
END Parrafo; 


La complejidad de este algoritmo es de orden O(n), debido al bucle que se 
repite a lo más n—1 veces (una por cada palabra menos la primera y aquellas que 
decidamos meter comprimiendo la línea), y que dentro del bucle todas las 
operaciones que se realizan son de complejidad constante. 


En cuanto a su funcionamiento, desafortunadamente no podemos afirmar que 
encuentre solución óptima en todos los casos, como pone de manifiesto el siguiente 
ejemplo. 

Supongamos que L = 26, b = 2, y que disponemos de n = 7 palabras, cuyas 
longitudes son 10, 10, 4, 8, 10, 12 y 12. 

El algoritmo anterior, tras meter las dos primeras palabras en la primera línea, 
tiene que tomar una decisión en cuanto a si la tercera palabra (de longitud 4) debe 
estar en la primera línea o no. En caso de estar, hay que comprimir los espacios, lo 
que ocasiona un coste de valor 2; por otro lado, si la pasa a la segunda línea es 
necesario expandir el espacio entre las dos palabras, lo que supone un coste de 
valor 4, 


Ante esta disyuntiva, el algoritmo decide incluirla en la primera línea, lo que da 
lugar a la siguiente descomposición en líneas (expresadas con paréntesis): 


(10, 10, 4), (8, 10), (12, 12). 


El coste global de esta descomposición es 8 (22+6+0), mientras que si hubiera 
tomado la alternativa que inicialmente tenía más coste hubiera llegado a la 
descomposición: 


(10, 10), (4, 8, 10), (12, 12) 


cuyo coste global es 4 (= 4+0+0). 


El motivo del fallo de este algoritmo es su “glotonería”, como le ocurre a todos 
los algoritmos ávidos. En general este problema lo va a tener cualquier algoritmo 
que, sin disponer de posibilidades de decidir el orden en el que se van produciendo 
las entradas, no sea capaz de hacer sacrificios locales para obtener resultados 
globales óptimos. 


En cuanto al segundo caso que se plantea en el enunciado de este problema, la 
situación es mucho más simple ya que no hay que tomar decisiones. O la palabra 
cabe, o si no hay que pasarla a la siguiente línea pues no se pueden comprimir los 
espacios entre palabras. El algoritmo que implementa tal estrategia puede obtenerse 
modificando el anterior: 


PROCEDURE Parrafo2(L:CARDINAL;n:CARDINAL;VAR 1:LONGPALS; 
VAR sol: SOLUCION) : CARDINAL; 
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(* L es la longitud de la linea, n el numero de palabras, y l es 
el vector con las longitudes de las n palabras. Devuelve el 
numero de lineas que ha necesitado *) 


VAR  tamanopalabras: CARDINAL; 
(* longitud de las palabras de la linea hasta el momento *) 
tamanolinea: CARDINAL; (* tamano de la linea en curso *) 


nlinea: CARDINAL; (* linea en curso *) 
npalabra: CARDINAL; (* palabra en curso *) 
nespacios: CARDINAL; (* num. espacios linea en curso *) 


PROCEDURE Espacio(L,tampalabras,nesp: CARDINAL) :REAL; 
BEGIN 

IF nesp=0 THEN RETURN 0.0 END; 

RETURN REAL (L-tampalabras)/REAL (nesp) ; 
END Espacio; 


PROCEDURE ResetContadores (linea,npal : CARDINAL) ; 


BEGIN 
IF npal<=n THEN (* para la ultima palabra no hacemos nada *) 


sol [linea] .primera:=npal; 
sol [linea] .coste:=0.0; 
tamanopalabras:=1[npal]; 
tamanolinea:=1[npal]; 
nespacios:=0 
END; 
END ResetContadores; 


PROCEDURE Coste(L,tampalabras,nesp: CARDINAL) :REAL; 
BEGIN 

RETURN REAL (nesp)*(Espacio(L,tampalabras,nesp)-1.0); 
END Coste; 


PROCEDURE CerrarLinea(linea,npal: CARDINAL); 

BEGIN 
sol [lineal .ultima:= npal-1; 
sol [lineal .espacio:= Espacio(L,tamanopalabras,nespacios); 
sol [lineal .coste:= Coste(L,tamanopalabras,nespacios); 

END CerrarLinea; 


BEGIN (* programa principal del procedimiento Parrafo2 *) 
(* metemos la primera palabra *) 
nlinea:=1;ResetContadores(nlinea,1); 
npalabra:=2; 

WHILE (npalabra<=n) DO 
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IF tamanolinea+1+1[npalabra]<=L THEN (* cabe *) 
INC(tamanolinea, 1+1 [npalabra]) ; 
INC(tamanopalabras,1[npalabra]); 
INC(nespacios) 

ELSE  (* no cabe x) 
CerrarLinea(nlinea,npalabra); INC(nlinea); 
ResetContadores (nlinea,npalabra) ; 

END; 

INC (npalabra) ; 

END; 
RETURN nlinea; 
END Parrafo2; 


4.5 LOS ALGORITMOS DE PRIM Y KRUSKAL 


Partimos de un grafo conexo, ponderado y no dirigido g = (V,4) de arcos no 
negativos, y deseamos encontrar el árbol de recubrimiento de g de coste mínimo. 
Por árbol de recubrimiento de un grafo g entendemos un subgrafo sin ciclos que 
contenga a todos sus vértices. En caso de haber varios árboles de coste mínimo, nos 
quedaremos de entre ellos con el que posea menos arcos. 


Existen al menos dos algoritmos muy conocidos que resuelven este problema, 
como son el de Prim y el de Kruskal. En ambos se va construyendo el árbol por 
etapas, y en cada una se añade un arco. La forma en la que se realiza esa elección 
es la que distingue a ambos algoritmos. 


El algoritmo de Prim comienza por un vértice y escoge en cada etapa el arco de 
menor peso que verifique que uno de sus vértices se encuentre en el conjunto de 
vértices ya seleccionados y el otro no. Al incluir un nuevo arco a la solución, se 
añaden sus dos vértices al conjunto de vértices seleccionados. 


En el de Kruskal se ordenan primero los arcos por orden creciente de peso, y en 
cada etapa se decide qué hacer con cada uno de ellos. Si el arco no forma un ciclo 
con los ya seleccionados (para poder formar parte de la solución), se incluye en 
ella; si no, se descarta. 


Nuestro objetivo en esta sección no es la de describir en detalle estos algoritmos 
desde el punto de vista de matemática discreta o la teoría de grafos, sino la de 
considerarlos desde la perspectiva de los algoritmos ávidos. 

a) En primer lugar, nos planteamos la implementación de ambos algoritmos 
siguiendo el esquema descrito y el análisis de su complejidad (espacio y 
tiempo). 

b) Estos algoritmos trabajan sobre grafos conexos. Nos preguntamos lo que 
ocurriría si por error se les suministrara un grafo no conexo. 


Solución (6) 


a) Para conseguir una implementación sencilla de ambos algoritmos, supondremos 
que los vértices del grafo ponderado no dirigido g = (V,4) están numerados de l a 
n, así que V= ([1,2,3,.... ny, y que el conjunto de arcos A viene dado por su matriz 
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de adyacencia ponderada g, siendo gl[i,/] el peso del arco (1,7) o bien oo si tal arco no 
existe. Por tanto, vamos a disponer de las siguientes definiciones; 


CONST n = ...; (* numero de vertices x*) 
TYPE GRAFO = ARRAY [1..n],[1..n] OF BOOLEAN; 
TYPE GRAFO_PONDERADO = ARRAY [1..n],[1..n] OF CARDINAL; 


Para almacenar el árbol de recubrimiento mínimo (también llamado de 
expansión), utilizaremos la matriz de adyacencia de un grafo no ponderado. 

Comenzaremos implementando el algoritmo de Kruskal, que necesita ordenar 
los arcos del grafo por orden creciente de peso: 


PROCEDURE Kruskal(VAR g:GRAFO_PONDERADO; VAR sol:GRAFO); 
VAR  p:PARTICION; 
c1,c2:CARDINAL; (* indican componentes de la particion *) 
g2:GRAFO_ORDENADO; 
i,narcos:CARDINAL; (* numero de arcos del grafo *) 


BEGIN 
InicParticion(p); 
narcos:=0Ordenar (g,82); (* construye g2 a partir de g y *) 
i:=0; (* devuelve el numero de sus arcos *) 


WHILE (NOT FinParticion(p)) AND (i<narcos) DO 
(* recorremos todos los arcos *) 
INC(i); 
c1:=0ObtenerComponente (p,g2[i].origen) ; 
c2:=0DbtenerComponente (p,g2[i] .destino); 
IF c1i<>c2 THEN 
Fusionar (p,c1,c2); 
sol[g2[i].origen,g2[i].destino] : =TRUE 
END; 
END 
END Kruskal; 


Veamos los tipos y funciones auxiliares utilizados. En primer lugar, 
PARTICION es un vector que indica a qué componente conexa del grafo pertenece 
cada vértice, puesto que lo que hacemos es asignar cada vértice a una componente. 
Cada componente será identificada por el valor de su menor elemento. 


TYPE PARTICION = ARRAY [1..n] OF CARDINAL; 


Inicialmente disponemos de todos los vértices del grafo y ningún arco, por lo 
cual cada uno de los vértices está asignado a una partición distinta (la que 
constituye el propio vértice aislado). Conforme se van añadiendo los arcos en cada 
paso del algoritmo el número de particiones va disminuyendo, y los vértices van 
siendo asignados a las particiones correspondientes. Al incluir un arco que conecta 
dos particiones, a los elementos de la mayor partición se les asigna el valor de la 
menor. 
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Por otro lado, el algoritmo necesita ordenar los arcos del grafo según su peso. 
Para ello utiliza: 


TYPE GRAFO_ORDENADO = ARRAY [1..n*(n-1)/2] OF ITEM; 
TYPE ITEM = RECORD origen, destino:CARDINAL; peso:CARDINAL END; 


La función InicParticion se necesita para inicializar las correspondientes 
particiones, constituyendo cada vértice como una partición distinta: 


PROCEDURE InicParticion (VAR p:PARTICION); 
VAR i:CARDINAL; 

BEGIN 
(* cada vertice en una componente distinta *) 
FOR i:=1 TO n DO plil:=i END 

END InicParticion; 


Para manejar las particiones, el procedimiento Fusionar, como su nombre 
indica, fusiona dos componentes, asignando a los elementos de la mayor el valor de 
los elementos de la menor: 


PROCEDURE Fusionar (VAR p:PARTICION;a,b:CARDINAL); 
VAR i,temp:CARDINAL; 
BEGIN 
IF (a>b) THEN (* los intercambiamos *) 
temp:=a; a:=b; b:=temp 
END; 
FOR i:=1 TO n DO 
IF plil=b THEN p[lil]:=a END 
END; 
END Fusionar; 


La función FinParticion comprueba si existe solamente una componente conexa 
en toda la partición: 


PROCEDURE FinParticion (VAR p:PARTICION) : BOOLEAN; 
VAR i:CARDINAL; 
BEGIN 
FOR i:=1 TO n DO 
IF p[lil<>1 THEN RETURN FALSE END 
END; 
RETURN TRUE; 
END FinParticion; 
Y la función ObtenerComponente devuelve el representante de la componente a 
la que pertenece un vértice: 


PROCEDURE ObtenerComponente (VAR p:PARTICION; i:CARDINAL) : CARDINAL; 
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BEGIN 
RETURN pli] 
END ObtenerComponente; 


Por último, la función Ordenar construye un GRAFO_ORDENADO a partir del 
grafo original con todos sus arcos no vacíos ordenados de menor a mayor peso. 
Esta función devuelve el número de arcos no vacíos que componen el grafo 
original, y no la incluimos aquí por no extender excesivamente el desarrollo del 
problema. Para implementarla puede seguirse cualquier método de ordenación: 


PROCEDURE Ordenar (VAR g:GRAFO_PONDERADO; 
VAR g2:GRAFO_ORDENADO) : CARDINAL; 


Para el cálculo de su complejidad temporal, veamos el orden de complejidad de 
las partes que lo componen: 


e En primer lugar, Buscar es de orden O(1) e InicParticion de orden O(n). 


e El tiempo de ejecución de las funciones Fusionar y FinParticion va a depender 
del número de componentes conexas existentes en la partición pero como en 
cada paso este número se divide por dos, podemos concluir que su complejidad 
es de orden O(logn). 


e Por otro lado, la ordenación de los arcos puede realizarse en un tiempo del 
orden de O(aloga), siendo a el número de arcos del grafo. Como se verifica que 
(n—-1) < a < n(n—1)/2 por tratarse de un grafo conexo, su orden es O(alogn). 


Resumiendo, el algoritmo consta de una inicialización de orden O(alogn), 
seguido por un bucle que se repite a veces en donde existen dos operaciones de 
orden O(logn) y varias de orden O(1). Por consiguiente, su complejidad temporal 
es de orden O(alogn). 


Una vez más, es importante hacer notar en este punto que las afirmaciones 
anteriores se deben a que en esta implementación hemos utilizado el paso de 
argumentos que sean vectores o matrices por referencia en vez de por valor aun 
cuando no fuera necesario modificar el valor de tales argumentos. En caso 
contrario, cada invocación de función supondría una copia de los argumentos a la 
pila, con el tiempo que eso conlleva. 


Respecto a su complejidad espacial, ésta es de orden O(m?) pues de esta 
complejidad es la tabla que representa el grafo ordenado. Si en vez de utilizar 
matrices de adyacencia hubiésemos utilizado una representación no acotada, la 
complejidad espacial del algoritmo sería de orden O(a) (puesto que sólo hay que 
almacenar los arcos, y por ser un grafo conexo sabemos que n—-1 < a < n(n-1)/2), 
aunque quizá se hubiera empeorado la complejidad temporal por el tiempo de 
acceso asociado a este tipo de estructuras. 

Veamos ahora el algoritmo de Prim. Para su implementación vamos a necesitar 
definir dos tipos especiales: 


TYPE MASPROXIMO = ARRAY [2..n] OF CARDINAL; 
TYPE DISTMINIMA = ARRAY [2..n] OF CARDINAL; 
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siendo MASPROXIMOT[1] el vértice del conjunto de vértices tratados hasta el 
momento más cercano al vértice i, y DISTMINIMA[i] la distancia desde ¡ a ese 
vértice más próximo. Así, podemos implementar el algoritmo de Prim como sigue: 


PROCEDURE Prim(VAR g:GRAFO_PONDERADO; VAR sol:GRAFO); 
VAR masproximo: MASPROXIMO;distmin:DISTMINIMA; 
min,i,j,k:CARDINAL; 
BEGIN 
InicProx(g,masproximo,distmin); 
FOR i:=2 TO n DO 
min:=MAX (CARDINAL) ; 
FOR j:=2 TO n DO 
IF (distmin[j]<min) AND (distmin[j]<>0) THEN 
min:=distmin[j]; k:=j 
END 
END; 
sol[k,masproximo[k]] :=TRUE; 
distmin[k]:=0; 
FOR j:=2 TO n DO 
IF (g[j,k]<distmin[k]) THEN 
distmin[x]:=8[j,k]; 
masproximo [j] :=k 
END 
END 
END 
END Prim; 


El procedimiento /nicProx inicializa adecuadamente las variables: 


PROCEDURE InicProx (VAR g:GRAFO_PONDERADO;VAR v:MASPROXIMO; 
VAR d:DISTMINIMA); 
VAR  ¡i:CARDINAL; 
BEGIN 
FOR i:=2 TO n DO 
v[il:=1; d[i]:=8[i,1] 
END 
END InicProx; 


En cuanto a su complejidad, el bucle principal se repite n—1 veces, y los dos 
más internos también, lo que da lugar a un tiempo de complejidad del orden de 
O((n-1)2(n-1)) = O(n5). 

Respecto a su complejidad espacial, ésta es también de orden O(1?) por la 
representación que hemos utilizado en este caso mediante matrices de adyacencia. 
En caso de haber utilizado una representación no acotada de los grafos podríamos 
haber conseguido una complejidad espacial de O(a), aunque quizá se hubiera 
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empeorado la complejidad temporal del algoritmo por el tiempo de acceso que 
suponen este tipo de estructuras. 


b) Supongamos que suministramos un grafo no conexo como entrada al algoritmo 
de Kruskal. En primer lugar el algoritmo terminaría puesto que el bucle va 
recorriendo todos los arcos de tal grafo. Y en segundo lugar su salida sería un árbol 
de expansión no conexo, pero que si observamos con detenimiento descubriremos 
que corresponde a la unión de los árboles de expansión mínimos de cada una de las 
componentes conexas del grafo. En este sentido, el algoritmo es bastante robusto. 


No ocurre así con el de Prim, que no funciona en este caso puesto que hace uso 
de que sea conexo para buscar en cada paso el vértice k sobre el cual construir la 
solución. El que no sea conexo hace que, o bien k valga cero y por tanto se indexe 
erróneamente la matriz solución, o bien no se modifique su valor en cada paso, lo 
que hace que el algoritmo no termine nunca. Podemos concluir por tanto que el 
suministrar un grafo conexo como entrada es una precondición fuerte del algoritmo 
de Prim implementado. 


Una vez analizados ambos algoritmos, el uso de uno u otro va a estar 
condicionado por el tipo de gr rafo que tratemos. La complejidad del algoritmo de 
Prim es siempre de orden O(n”) mientras que el orden de complejidad del algoritmo 
de Kruskal O(alogn) no sólo depende del número de vértices, sino también del 
número de arcos. Así, para grafos densos el número de arcos a es cercano a n(n— 
1)/2 por lo que el orden de complejidad del algoritmo de Kruskal es O(”logn), 
peor que la complejidad O(n?) de Prim. Sin embargo, para grafos dispersos en los 
que a es próximo a n, el algoritmo de Kruskal es de orden O(nlogn), 
comportándose probablemente de forma más eficiente que el de Prim. 


4.6 EL VIAJANTE DE COMERCIO 


Se conocen las distancias entre un cierto número de ciudades. Un viajante debe, a 
partir de una de ellas, visitar cada ciudad exactamente una vez y regresar al punto 
de partida habiendo recorrido en total la menor distancia posible. 


Este problema también puede ser enunciado más formalmente como sigue: dado 
un grafo g conexo y ponderado y dado uno de sus vértices vo, encontrar el ciclo 
Hamiltoniano de coste mínimo que comienza y termina en vo. 


Cara a intentar solucionarlo mediante un algoritmo ávido, nos planteamos las 
siguientes estrategias: 


a) Sea (C,v) el camino construido hasta el momento que comienza en vo y termina 
en v. Inicialmente C es vacío y v = vo. Si C contiene todos los vértices de g, el 
algoritmo incluye el arco (v,vo) y termina. Si no, incluye el arco (v,w) de 
longitud mínima entre todos los arcos desde v a los vértices w que no están en el 
camino C. 


b) Otro posible algoritmo ávido escogería en cada iteración el arco más corto aún 
no considerado que cumpliera las dos condiciones siguientes: (1) no formar un 
ciclo con los arcos ya seleccionados, excepto en la última iteración, que es 
donde completa el viaje; y (ii) no es el tercer arco que incide en un mismo 
vértice de entre los ya escogidos. 
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Nos piden implementar ambos algoritmos y probar su funcionamiento, dando 
ejemplos en donde encuentren solución y en donde fallen, si es que esto ocurre. 


Solución (O) 


a) El algoritmo pedido puede ser implementado utilizando los tipos de datos usados 
en el problema anterior, resultando: 


TYPE PRESENCIA=ARRAY [1..n] OF BOOLEAN; (* vertices considerados x*) 


PROCEDURE Viajantel(VAR g:GRAFO_PONDERADO; VAR sol:GRAFO) ; 
(* supone que el recorrido comienza en el vertice 1 *) 
VAR yaesta: PRESENCIA; 
i,verticeencurso,verticeanterior:CARDINAL; 
BEGIN 
FOR i:=1 TO n DO yaestali]:=FALSE END; 
verticeencurso:=1; 
FOR i:=1 TO n DO 
verticeanterior:=verticeencurso; 
yaesta[verticeanterior] :=TRUE; 
verticeencurso:=Busca(g,verticeencurso,yaesta); 
sol [verticeanterior,verticeencurso]:=TRUE; 
END; 
END Viajantel; 


La clave de este algoritmo está en la función Busca, que es la que realiza el 
proceso de selección, decidiendo en cada paso el siguiente vértice de entre los 
posibles candidatos: 


PROCEDURE Busca(VAR g:GRAFO_PONDERADO; vertice:CARDINAL; 
VAR yaesta: PRESENCIA) : CARDINAL; 
VAR mejorvertice,i,min:CARDINAL; 
BEGIN 
mejorvertice:=1; min:=MAX(CARDINAL) ; 
FOR i:=1 TO n DO 
IF (i<>vertice)AND(NOT (yaesta[i]))AND(g[vertice,il<min) THEN 
min:=g[vertice,il; mejorvertice:=i; 
END 
END; 
RETURN mejorvertice; 
END Busca; 


Respecto a los ejemplos de grafos en donde el algoritmo encuentra o no la 
solución Óptima, comenzaremos por un grafo en donde la encuentra. Sea entonces 


2 3 4 
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una tabla que representa la matriz de adyacencia de un grafo ponderado g, con 
cuatro vértices. Partiendo del vértice 1, el algoritmo encuentra la solución óptima, 
que está formada por los arcos 


(1,2,0,3),3,4),(4,1) 
lo que da lugar al ciclo (1,2,3,4,1), cuyo coste es 1 +4 +3 +2= 10, óptimo pues el 
resto de soluciones poseen costes superiores o iguales a él: 15, 17, 14, 17 y 10. 


Para ver un ejemplo en donde el algoritmo falla, consideraremos un grafo 
ponderado g» con seis vértices definido por la siguiente matriz de adyacencia: 


2 3 4 5 6 
1 3 10 11 7 25 
2 6 12 8 26 
3 9 4 20 
4 5 15 
5 18 


Partiendo del vértice 1 el algoritmo va a ir escogiendo la secuencia de arcos 
(1,2,0,3,6,5,5,4),(4,6),06,1) 


lo que da lugar al ciclo (1,2,3,5,4,6,1), cuyo coste es 3+6+4+5+15+25=58, 
Sin embargo, éste no es el ciclo con menor coste, pues el camino definido por los 
arcos: 


(1,2),0,3),G6,6),(6,4),(4,5),(5,1) 
tiene un coste de 3+6+20+15+5+7=56. 


b) El algoritmo pedido en este caso es muy similar al algoritmo de Kruskal que 
hemos visto en el problema anterior: 


PROCEDURE Viajante2 (VAR g:GRAFO_PONDERADO; VAR sol:GRAFO); 
VAR  p:PARTICION; 
c1,c2:CARDINAL; (* indican componentes de la particion *) 
g_ordenado: GRAFO_ORDENADO; 
i,narcos:CARDINAL; (* numero de arcos del grafo *) 
u,v:CARDINAL; (* vertices tratados en cada paso *) 
ndest:ARRAY [1..n] OF CARDINAL; (* num. veces que cada 
vertice es destino en la solucion *) 
BEGIN 
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InicParticion(p); 
FOR i:=1 TO n DO ndest[i]:=0 END; 
narcos:=0Ordenar(g,g_ordenado);  (* devuelve el num. de arcos *) 
i:=0; 
WHILE (NOT FinParticion(p)) AND (i<narcos) DO 

INC(i); 


u:=g_ordenado[i].origen; 
v:=g_ordenadoli].destino; 
c1:=0ObtenerComponente (p,u); 
c2:=0btenerComponente (p,v); 
IF (ci<>c2) AND (ndest[u]<2) AND (ndest[v]<2) THEN 
Fusionar (p,c1,c2); 
sol [u,v] :=TRUE; 
INC (ndest [u]) ; 
INC (ndest [v]); 
END; 
END; 
(* ahora solo nos queda el ultimo vertice, que cierra el ciclo *) 
WHILE (i<narcos) DO 
INC(i); 
u:=g_ordenado[i].origen; 
v:=g_ordenadoli].destino; 
IF (ndest[ul<2) AND (ndest[v]<2) THEN (* lo encontramos! *) 
sol [lu,v] :=TRUE; 
INC (ndest [u]); 
INC (ndest [v]); 
i:=narcos; (* para salirnos del bucle *) 
END; 
END; 
END Viajante2; 


Los tipos y funciones utilizados por este procedimiento son los ya vistos en el 
problema anterior para el algoritmo de Kruskal. 

El grafo g, es un ejemplo para el cual el algoritmo encuentra la solución óptima, 
al igual que ocurría con el anterior. Sin embargo, este algoritmo no encuentra la 
solución óptima en todos los casos, como ocurre por ejemplo con el grafo g, del 
apartado anterior. Para él, y partiendo del vértice 1, el algoritmo va a ir escogiendo 
la secuencia de arcos 


(1,2),8,5),(4,5),2,3),(4,6),(1,6) 


que da lugar al mismo ciclo que obteniamos antes, (1,2,3,5,4,6,1), de coste 58 y por 
tanto no óptimo. 


4.7 LA MOCHILA 


Dados n elementos e;, e», ..., €, CON pesos py, Pz, ..., Pn y beneficios by, ba, ..., bn, y 
dada una mochila capaz de albergar hasta un máximo de peso M (capacidad de la 
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mochila), queremos encontrar las proporciones de los n elementos xX;, X>, ..., Xp 
(0 < x;< 1) que tenemos que introducir en la mochila de forma que la suma de los 
beneficios de los elementos escogidos sea máxima. 


Esto es, hay que encontrar valores (x;, x2, ..., Xn) de forma que se maximice la 


n n 
cantidad y b,x,, sujeta a la restricción de px, <M. 
i=1 i=l 


Solución (8) 


Un algoritmo ávido que resuelve este problema ordena los elementos de forma 
decreciente respecto a su ratio b,/ p;, y va añadiendo objetos mientras éstos vayan 
cabiendo. 

Para implementar este algoritmo vamos a definir los siguientes tipos y 
constantes: 


CONST MAXELEM = ...; (* numero maximo de elementos *) 

TYPE REGISTRO RECORD peso:REAL; beneficio:CARDINAL END; 
ELEMENTOS ARRAY [1..MAXELEM] OF REGISTRO; 
MOCHILA ARRAY [1..MAXELEM] OF REAL; (* composicion finalx) 


Con ellos, el algoritmo ávido para resolver el problema pedido con n elementos 
y para una capacidad de la mochila M es: 


PROCEDURE Mochila(VAR e:ELEMENTOS; n:CARDINAL; M:REAL,; 
VAR sol:MOCHILA) ; 
(* supone que los elementos de "e" estan en orden decreciente de 
su ratio b;/p; *) 
VAR peso_en_curso:REAL; i:CARDINAL; 
BEGIN 
FOR i:=1 TO MAXELEM DO so1[i]:=0.0 END; 
peso_en_curso:=0.0; i:=1; 
WHILE (peso_en_curso<M) AND (i<=n) DO 
IF (e[il].peso+peso_en_curso)<=M THEN sol[i]:=1.0; 
ELSE sol[i] :=(M-peso_en_curso)/elil.peso 
END; 
peso_en_curso:=peso_en_curso+(sol[il*e[il.peso); INC(i) 
END 
END Mochila; 


Respecto al tiempo de ejecución del algoritmo, éste consta de la ordenación 
previa, de complejidad O(nlogn), y de un bucle que como máximo recorre todos 
los elementos, de complejidad O(2), por lo que el tiempo total resulta ser de orden 
O(nlogn). 

Para demostrar que siguiendo la ordenación dada el algoritmo encuentra la 
solución óptima, vamos a suponer sin pérdida de generalidad que los elementos ya 


ALGORITMOS ÁVIDOS 165 


están ordenados de esta forma, es decir, que b;/ p; 2 b;/ p; si i < j. Por simplicidad 
en la notación utilizaremos los símbolos de sumatorios sin los índices. 

Sea X= (x1,X2,...,Xn) la solución encontrada por el algoritmo. Si x,= 1 para todo 
i, la solución es óptima. Si no, sea j el menor índice tal que x,< 1. Por la forma en 
que trabaja el algoritmo, x,= 1 para todo ¡<j, x,= 0 para todo ¡> j, y además 
Yxp¡= M. Sea B(X) = Xx;b; el beneficio que se obtiene para esa solución. 

Consideremos entonces Y = (p1,y»,....y,) otra solución, y sea B(Y) = *Xy;b, su 
beneficio. Por ser solución cumple que Xyp;< M. Entonces, restando ambas 
capacidades, podemos afirmar que X(xp;— y¡p;i) > 0. 

Calculemos entonces la diferencia de beneficios: 


B(X) —- B(Y) = Mx; yb; =Ux;— y0pi (b/p;). 
La segunda igualdad se obtiene multiplicando y dividiendo por p;. Con esto, 
para el índice y escogido anteriormente sabemos que ocurre: 


e Si¡<j7 entonces x;= 1, y por tanto (x;— y;) 2 0. Además, (b/p;) 2 (bp) por la 
ordenación escogida (decreciente). 


e Si¡>]7entonces x;= 0, y por tanto (x;— y;) € 0. Además, (b//p;) € (b/p;) por la 
ordenación escogida (decreciente). 


e Por último, si ¡= entonces (b//p;) = (by/p;). 


En consecuencia, podemos afirmar que (x;— yMb/p;) 2 (e; — yY(b//p;) para todo i, 
y por tanto: 


BA) - B(Y) = Lx yop (b/pi) 2 (bp xi y dpi 2 0, 
esto es, B(X) > B(Y), como queríamos demostrar. 


4.8 LA MOCHILA (0,1) 


Consideremos una modificación al problema de la Mochila en donde añadimos el 
requerimiento de que no se pueden escoger fracciones de los elementos, es decir, 
x=06x;¡=1,1<1i<m. Como en el problema original, deseamos maximizar la 


n n 

cantidad A sujeta a la restricción y px, < M. ¿Seguirá funcionando el 
il i=l 

algoritmo anterior en este caso? 


Solución (O) 


Lamentablemente no funciona, como pone de manifiesto el siguiente ejemplo. 
Supongamos una mochila de capacidad M= 6, y que disponemos de los siguientes 
elementos (ya ordenados respecto a su ratio beneficio/peso): 
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E X2 X3 


Peso 5 3 3 
Beneficio 11 6 6 


El algoritmo sólo introduciría el primer elemento, con un beneficio de 11, 
aunque sin embargo es posible obtener una mejor elección: podemos introducir los 
dos últimos elementos en la mochila puesto que no superan su capacidad, con un 
beneficio total de 12. 


4.9 EL FONTANERO DILIGENTE 


Un fontanero necesita hacer n reparaciones urgentes, y sabe de antemano el tiempo 
que le va a llevar cada una de ellas: en la tarea ¡-ésima tardará f; minutos. Como en 
su empresa le pagan dependiendo de la satisfacción del cliente, necesita decidir el 
orden en el que atenderá los avisos para minimizar el tiempo medio de espera de 
los clientes. 


En otras palabras, si llamamos E; a lo que espera el cliente ¡-ésimo hasta ver 
reparada su avería por completo, necesita minimizar la expresión: 


En) = Y E y 


Deseamos diseñar un algoritmo ávido que resuelva el problema y probar su 
validez, bien mediante demostración formal o con un contraejemplo que la refute. 


Solución (8) 


En primer lugar hemos de observar que el fontanero siempre tardará el mismo 
tiempo global T = ft| + t¿ + ... + t£, en realizar todas las reparaciones, 
independientemente de la forma en que las ordene. Sin embargo, los tiempos de 
espera de los clientes sí dependen de esta ordenación. 


En efecto, si mantiene la ordenación original de las tareas (1, 2, ..., n), la 
expresión de los tiempos de espera de los clientes viene dada por: 


E>=t+b 


E,=t+b+..+t,. 


Lo que queremos encontrar es una permutación de las tareas en donde se 
minimice la expresión de £(n) que, basándonos en las ecuaciones anteriores, viene 
dada por: 
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Em)= Y E, AN 


Vamos a demostrar que la permutación óptima es aquella en la que los avisos se 
atienden en orden creciente de sus tiempos de reparación. 


Para ello, denominemos X= (x;,x>,...,x,) a una permutación de los elementos 
(1,2,...,n), y sean (s;,52,....Sn) Sus respectivos tiempos de ejecución, es decir, 
(S1,52,-..,5,) Va a ser una permutación de los tiempos orginales (t;,£»,...,t). 
Supongamos que no está ordenada en orden creciente de tiempo de reparación, es 
decir, que existen dos números x, < x; tales que s;> s;. 


Sea Y = (y 1,y2,...,Yn) la permutación obtenida a partir de X intercambiando x;, con 
Xj, €s decir, 4 = Xp 81 k Xiy k A], Y; =Xj Y; = Xi. 

Si probamos que E(Y) < E(M) habremos demostrado lo que buscamos, pues 
mientras más ordenada (según el criterio dado) esté la permutación, menor tiempo 
de espera supone. Pero para ello, basta darse cuenta que 


E(Y)=(n-x,+Ds,+(n=x,+Ds5,+ DD (n—-k+Ds, 
: k=Lk+i,kéj 
y que, por tanto: 


EX) - EV) = (n= x:+ Msi sj) + (Mx + Ds, 5) = (6 — xls — s;) > 0. 


En consecuencia, el algoritmo pedido consiste en atender a las llamadas en 
orden inverso a su tiempo de reparación. Con esto conseguirá minimizar el tiempo 
medio de espera de los clientes, tal y como hemos probado. 


4.10 MÁS FONTANEROS 


Supongamos que en la empresa del fontanero del apartado anterior aumenta el 
número de clientes debido a su buena calidad de servicio y deciden contratar a más 
personal, con lo que disponen de un total de F fontaneros para realizar las n tareas. 


Modificar el diseño del algoritmo para que realice la asignación de tareas a 
fontaneros siguiendo con el criterio de calidad expuesto anteriormente. 


Solución (8) 


En este caso también tenemos que minimizar el tiempo medio de espera de los 
clientes, pero lo que ocurre es que ahora existen F' fontaneros dando servicio 
simultáimeamente. Basándonos en el método utilizado anteriormente, la forma 
óptima de atender los avisos va a ser la siguiente: 


e En primer lugar, se ordenan los avisos por orden creciente de tiempo de 
reparación. 
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e Un vez hecho esto, se van asignando los avisos por este orden, siempre al 
fontanero menos ocupado. En caso de haber varios con el mismo grado de 
ocupación, se escoge el de número menor. 


En otras palabras, si los avisos están ordenados de forma que f; < ft; si i< jj, 
asignaremos al fontanero k los avisos k, k+F, k+2F, ... 


4.11 LA ASIGNACIÓN DE TAREAS 


Supongamos que disponemos de n trabajadores y n tareas. Sea b;,> 0 el coste de 
asignarle el trabajo j al trabajador ¡. Una asignación de tareas puede ser expresada 
como una asignación de los valores 0 Óó 1 a las variables xj, donde 
x= 0 significa que al trabajador ¡ no le han asignado la tarea j, y x¡;= 1 indica que 
sí. Una asignación válida es aquella en la que a cada trabajador sólo le corresponde 
una tarea y cada tarea está asignada a un trabajador. Dada una asignación válida, 
definimos el coste de dicha asignación como: 


n n 
22 Abs. 
¡al ¡=1 


Diremos que una asignación es óptima si es de mínimo coste. Cara a diseñar un 
algoritmo ávido para resolver este problema podemos pensar en dos estrategias 
distintas: asignar cada trabajador la mejor tarea posible, o bien asignar cada tarea al 
mejor trabajador disponible. Sin embargo, ninguna de las dos estrategias tiene por 
qué encontrar siempre soluciones óptimas. ¿Es alguna mejor que la otra? 


Solución (O) 
Este es un problema que aparece con mucha frecuencia, en donde los costes son o 
bien tarifas (que los trabajadores cobran por cada tarea) o bien tiempos (que tardan 
en realizarlas). Para implementar ambos algoritmos vamos a definir la matriz de 
costes (b;;): 


TYPE COSTES = ARRAY[1..n],[1..n] OF CARDINAL; 


que forma parte de los datos de entrada del problema, y la matriz de asignaciones 
(x;;), que es la que buscamos: 


TYPE ASIGNACION = ARRAY[1..n],[1..n] OF BOOLEAN; 


Con esto, el primer algoritmo puede ser implementado como sigue: 


PROCEDURE AsignacionOptima(VAR b:COSTES; VAR x:ASIGNACION) ; 
VAR trabajador,tarea: CARDINAL; 
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BEGIN 
FOR trabajador:=1 TO n DO (* inicializamos la matriz solucion *) 
FOR tarea:=1 TO n DO 
x[trabajador,tarea] :=FALSE 
END 
END; 
FOR trabajador:=1 TO n DO 
x[trabajador,MejorTarea(b,x,trabajador)] : =TRUE 
END 
END AsignacionOptima; 


La función MejorTarea es la que busca la mejor tarea aún no asignada para ese 
trabajador: 


PROCEDURE MejorTarea (VAR b:COSTES; VAR x:ASIGNACION; 
i: CARDINAL) : CARDINAL; 
VAR tarea,min,mejortarea: CARDINAL; 
BEGIN 
min:=MAX (CARDINAL) ; 
FOR tarea:=1 TO n DO 
IF (NOT YaEscogida(x,i,tarea))AND(b[i,tarea]<min) THEN 
min:=b[i,tarea]; 
mejortarea:=tarea 
END 
END; 
RETURN mejortarea; 
END MejorTarea; 


Por último, la función YaEscogida decide si una tarea ya ha sido asignada 
previamente: 


PROCEDURE YaEscogida(VAR x: ASIGNACION; 
trabajador,tarea: CARDINAL) : BOOLEAN; 
VAR i:CARDINAL; 
BEGIN 
FOR i:=1 TO trabajador-1 DO 
IF x[i,tarea] THEN RETURN TRUE END 
END; 
RETURN FALSE; 
END YaEscogida; 


Lamentablemente, este algoritmo ávido no funciona para todos los casos como 
pone de manifiesto la siguiente matriz de valores: 


Tarea 
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1 2 3 
1 116 20 18 
Trabajador 2 11 15 17 
E E! 20 


Para ella, el algoritmo produce una matriz de asignaciones en donde los “unos” 
están en las posiciones (1,1), (2,2) y (3,3), esto es, asigna la tarea i al trabajador ¡ 
(¡=1, 2,3), con un valor de la asignación de 51 (= 16 + 15 + 20). Sin embargo la 
asignación óptima se consigue con los “unos” en posiciones (1,3), (2,1) y (3,2), 
esto es, asigna la tarea 3 al trabajador 1, la 1 al trabajador 2 y la tarea 2 al 
trabajador 3, con un valor de la asignación de 30 (5 18 + 11 +1). 

Si utilizamos la segunda estrategia nos encontramos en una situación análoga. 
En primer lugar, su implementación es: 


PROCEDURE AsignacionOptima2(VAR b:COSTES; VAR x: ASIGNACION) ; 
VAR trabajador,tarea:CARDINAL; 
BEGIN 
FOR trabajador:=1 TO n DO (* inicializamos la matriz solucion *) 
FOR tarea:=1 TO n DO 
x[trabajador,tarea] :=FALSE 
END 
END; 
FOR tarea:=1 TO n DO 
x[MejorTrabajador(b,x,tarea), tarea] : =TRUE 
END; 
END Asignacion0Optima2; 


La función MejorTrabajador es la que busca el mejor trabajador aún no 
asignado para esa tarea: 


PROCEDURE MejorTrabajador (VAR b:COSTES; VAR x: ASIGNACION; 
i: CARDINAL) : CARDINAL; 
VAR trabajador, min,mejortrabajador:CARDINAL; 
BEGIN 
min:=MAX (CARDINAL) ; 
FOR trabajador:=1 TO n DO 
IF(NOT YaEscogido(x,i,trabajador))AND(b[trabajador,i]<min)THEN 
min:=b[trabajador,i]; 
mejortrabajador:=trabajador 
END 
END; 
RETURN mejortrabajador'; 
END MejorTrabajador'; 


Por último, la función YaEscogido decide si un trabajador ya ha sido asignado 
previamente: 
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PROCEDURE YaEscogido(VAR x: ASIGNACION; 
trabajador,tarea: CARDINAL) : BOOLEAN; 
VAR i:CARDINAL; 
BEGIN 
FOR i:=1 TO tarea-1 DO 
IF x[trabajador,i] THEN RETURN TRUE END 
END; 
RETURN FALSE; 
END YaEscogido; 


Lamentablemente, este algoritmo ávido tampoco funciona para todos los casos 
como pone de manifiesto la siguiente matriz de valores: 


Tarea 
1 2 3 
1 [16 11 17 
Trabajador 2 (20 15 1 
3 |18 17 20 


Para ella, el algoritmo produce una matriz de asignaciones en donde los “unos” 
vuelven a estar en las posiciones (1,1), (2,2) y (3,3), con un valor de la asignación 
de 51 (=16+15+20). Sin embargo la asignación óptima se consigue con los “unos” 
en posiciones (3,1), (1,2) y (2,3), con un valor de la asignación de 30 (2=18+11+1). 


Respecto a la pregunta de si una estrategia es mejor que la otra, la respuesta es 
que no. La razón es que las soluciones son simétricas. Aún más, una es la imagen 
especular de la otra. Por tanto, si suponemos equiprobables los valores de las 
matrices, ambos algoritmos van a tener el mismo número de casos favorables y 
desfavorables. 


4.12 LOS FICHEROS Y EL DISQUETE 


Supongamos que disponemos de » ficheros f;, f>, ..., f, con tamaños l;, l», ..., l, y un 
disquete de capacidad d <l, + l, +... + L. 


a) Queremos maximizar el número de ficheros que ha de contener el disquete, y 
para eso ordenamos los ficheros por orden creciente de su tamaño y vamos 
metiendo ficheros en el disco hasta que no podamos meter más. Determinar si 
este algoritmo ávido encuentra solución óptima en todos los casos. 


b) Queremos llenar el disquete tanto como podamos, y para eso ordenamos los 
ficheros por orden decreciente de su tamaño, y vamos metiendo ficheros en el 
disco hasta que no podamos meter más. Determinar si este algoritmo ávido 
encuentra solución óptima en todos los casos. 


Solución (8) 
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a) Supongamos los ficheros f¡, f>, ..., f, ordenados respecto a su tamaño, esto es, 
I, SL <... < l,, Dicho de otra forma, si llamamos £ a la función que devuelve la 
longitud de un fichero dado, lo que tenemos es que L(f,) € L(f) < ... € L(f;). 


El algoritmo ávido indicado en el enunciado de este apartado sugiere ir tomando 
los ficheros según están ordenados hasta que no quepa ninguno más. 


Vamos a demostrar que el número de ficheros que caben de esta forma es el 
óptimo. Sea m el número de ficheros que dice el algoritmo que caben en un 
disquete de capacidad d. Si d > XL(f;) entonces m coincide con n. Pero si 
d < YL(f;), por la forma en la que trabaja el algoritmo sabemos que se verifica la 
siguiente relación: 


m+l 


21) <d< LO) [4.5] 


Sea entonces g;, 2», ..., £, Otro subconjunto de ficheros que caben también en el 
disquete, es decir, tal que 


Y L(g,)<d. [4.6] 
i=1 


Veamos que s < m. En primer lugar, vamos a suponer sin pérdida de generalidad 
que el conjunto de los ficheros g; está también ordenado en orden creciente de 
tamaño: 


L(g1) < L(22) < ... < L(gs). 


Como ambas descomposiciones son distintas, sea k el primer índice tal que 
fe + gx Podemos suponer sin perder generalidad que k = 1, puesto que si hasta 
f-1 los ficheros son iguales podemos eliminarlos y restar la suma de los tamaños de 
tales ficheros a la capacidad de nuestro disquete. 


Por la forma en que funciona el algoritmo, si f, + g, entonces L(f,) < L(g¡) pues 
f¡ era el fichero de menor tamaño. Además, g, corresponderá a un fichero f, en la 
ordenación inicial, con a > 1. Análogamente, g, corresponderá a un fichero f; en la 
ordenación inicial, con b > a > 1, y por tanto b > 2, por lo que 
L(g2) 2 L(f2). Repitiendo el razonamiento, los ficheros g, se corresponderán con 
ficheros de la ordenación inicial, pero siempre cumpliendo que: 


L(e) 2 LMf) (1<i¡<s). [4.7] 


Ahora bien, por la relaciones [4.6] y [4.7] obtenemos 


d2918)2 10) 


Pero entonces, por [4.5], s ha de ser estrictamente menor que m+l1, y por tanto 
s < m, como queríamos demostrar. 


b) En este caso el algoritmo no funciona, como pone de manifiesto el siguiente 
ejemplo: sean (15,10,10,2) los tamaños de cuatro ficheros (n = 4) ya ordenados en 
orden decreciente, y supongamos que disponemos de un disquete con capacidad 
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d = 22. La solución que encontraría el algoritmo ávido es 17 (+15+2), almacenando 
en el disquete el primer y el último fichero. Sin embargo existe una solución que 
aprovecha aún más el disquete, la formada por los tres últimos ficheros. Con ellos 
se ocupa completamente el disquete. 


4.13 EL CAMIONERO CON PRISA 


Un camionero conduce desde Bilbao a Málaga siguiendo una ruta dada y llevando 
un camión que le permite, con el tanque de gasolina lleno, recorrer n kilómetros sin 
parar. El camionero dispone de un mapa de carreteras que le indica las distancias 
entre las gasolineras que hay en su ruta. Como va con prisa, el camionero desea 
pararse a repostar el menor número de veces posible. 


Deseamos diseñar un algoritmo ávido para determinar en qué gasolineras tiene 
que parar y demostrar que el algoritmo encuentra siempre la solución óptima. 


Solución (9/8) 


Supondremos que existen G gasolineras en la ruta que sigue el camionero entre 
Bilbao y Málaga, incluyendo una en la ciudad destino, y que están numeradas del 0 
(gasolinera en Bilbao) a G-1 (la situada en Málaga). 


Supondremos además que disponemos de un vector con la información que 
tiene el camionero sobre las distancias entre ellas: 


TYPE DISTANCIA = ARRAY [1..G-1] OF CARDINAL; 


de forma que el ¡-ésimo elemento del vector indica los kilómetros que hay entre las 
gasolineras ¡-1 e i. Para que el problema tenga solución hemos de suponer que 
ningún valor de ese vector es mayor que el número n de kilómetros que el camión 
puede recorrer sin repostar. 


Con todo esto, el algoritmo ávido pedido va a consistir en intentar recorrer el 
mayor número posible de kilómetros sin repostar, esto es, tratar de ir desde cada 
gasolinera en donde se pare a repostar a la más lejana posible, así hasta llegar al 
destino. 


Para demostrar la validez de este algoritmo ávido, sean x;,xz,...,x, las gasolineras 
en donde este algoritmo decide que hay que parar a repostar, y sea y1,J,...,V, Otro 
posible conjunto solución de gasolineras. Llamaremos X a un camión que sigue la 
primera solución, e Y a un camión que se guía por la segunda. Sea N el número 
total de kilómetros a recorrer (distancia entre las dos ciudades), y sea DLi] la 
distancia recorrida por el camionero hasta la ¡-ésima gasolinera (1 < ¡ < G-1). Es 
decir, 


Dm = Y da y  D[G-1]=N5. 


Lo que tenemos que demostrar es que s < f, puesto que lo que queríamos 
minimizar era el número de paradas a realizar. Para probarlo, basta con demostrar 
que x; > y; para todo k. 
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En primer lugar, como ambas descomposiciones son distintas, sea k el primer 
índice tal que x; + y. Podemos suponer sin perder generalidad que k = 1, puesto 
que hasta x; ¡ los viajes son iguales, y en la gasolinera xj, ambos camiones 
rellenan su tanque completamente. 

Por la forma en que funciona el algoritmo, si x, + y, entonces x; > y1], pues xj 
era la gasolinera más alejada a donde podía viajar el camionero sin repostar. 

Además, también se tiene que xz > y», pues x, era la gasolinera más alejada a 
donde podía viajar desde x, el camionero sin repostar. Para probar este hecho, 
supongamos por reducción al absurdo que y, fuera estrictamente mayor que xz. 
Pero si Y consigue ir desde y, a y, es que hay menos de n kilómetros entre ellas, es 
decir, 


Dlv]- Dl] <n. 


Por tanto desde x, también hay menos de n kilómetros hasta y», esto es, 
DD] -Dlxi] <n 


puesto que Dly,] < D[x¡]. Entonces el método no hubiera escogido x, como 
siguiente gasolinera a x, sino y, porque el algoritmo busca siempre la gasolinera 
más alejada de entre las que alcanza. 

Repitiendo el proceso, vamos obteniendo en cada paso que x; > y; para todo k, 
hasta llegar a la ciudad destino, lo que demuestra la hipótesis. 

El siguiente procedimiento implementa este algoritmo, devolviendo un vector 
que indica en qué gasolineras ha de pararse y en cuáles no: 


TYPE SOLUCION = ARRAY [1..G-1] OF BOOLEAN; 
PROCEDURE Deprisa(n:CARDINAL; VAR d:DISTANCIA; VAR sol: SOLUCION); 
VAR i,numkilometros: CARDINAL; 
BEGIN 
FOR i:=1 TO G-1 DO sol[i]:=FALSE END; 
i:=0; 
numkilometros:=0; 
REPEAT 
REPEAT 
INC(i); 
numkilometros:=numkilometros+dli]'; 
UNTIL (numkilometros>n) OR (i=G-1); 


IF numkilometros>n THEN (* si nos hemos pasado... *) 
DEC(i); (* volvemos atras una gasolinera *) 
sol [i] :=TRUE; (* y repostamos en ella. *) 
numkilometros:=0; (* reset contador x*) 

END 


UNTIL. (4=G-1);3 
END Deprisa; 
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4.14 LA MULTIPLICACIÓN ÓPTIMA DE MATRICES 


Necesitamos en este problema calcular la matriz producto M de n matrices dadas 
M=MM,...M,. Por ser asociativa la multiplicación de matrices, existen muchas 
formas posibles de realizar esa operación, cada una con un coste asociado (en 
términos del número de multiplicaciones escalares). Si cada M; es de dimensión 
d; xd; (1 <i< n), multiplicar M,M;,, requiere d,_¡d; d;,, operaciones. 

El problema consiste en encontrar el mínimo número de operaciones necesario 
para calcular el producto M. 


En general, el coste asociado a las distintas formas de multiplicar las n matrices 
puede ser bastante diferente de unas a otras. Por ejemplo, para n = 4 y para las 
matrices M¡, M>, M3 y M4 cuyos órdenes son: 


M:(30x1), M,(1x40), M(40x10), M4(10x25) 


hay cinco formas distintas de multiplicarlas, y sus costes asociados (en términos de 
las multiplicaciones escalares que necesitan) son: 


((M,M>)M3)M4  =30-1:40 + 30-40-10 +30-10-25  = 20.700 
MMMM) =40-10-25 + 1:40:25 +30-1:25  = 11.750 
(M¡M>XM¿Ma)  =30-1:40 + 40-10-25 + 30-40-25 = 41.200 
Mi(M.M3Ms) =1:40-10+ 1:10:25 + 30-1:25 = 1.400 
(Mi(M>M3)Ma =1:40:10+30-1-10+30-10-25  = 8.200 


Como puede observarse, la mejor forma necesita casi treinta veces menos 
multiplicaciones que la peor, por lo cual es importante elegir una buena asociación. 
Podríamos pensar en calcular el coste de cada una de las opciones posibles y 
escoger la mejor de entre ellas antes de multiplicar. Sin embargo, para valores 
grandes de n esta estrategia es inútil, pues el número de opciones crece 
exponencialmente con n. De hecho, el número de opciones posible sigue la 
sucesión de los números de Catalán: 


pt 2n -2 » 
T(m) = Erora=0="| 8 |: e) 


¡=1 n 


Parece entonces muy útil la búsqueda de un algoritmo ávido que resuelva 
nuestro problema. La siguiente lista presenta cuatro estrategias diferentes: 


a) Multiplicar primero las matrices M,M;,, cuya dimensión común d, sea la menor 
entre todas, y repetir el proceso. 


b) Multiplicar primero las matrices M¿M¿+, cuya dimensión común d; sea la mayor 
entre todas, y repetir el proceso. 


c) Realizar primero la multiplicación de las matrices M¡M;+, que requiera menor 
número de operaciones (d,_¡d;d;+1), y repetir el proceso. 


d) Realizar primero la multiplicación de las matrices M¡M,,, que requiera mayor 
número de operaciones (d,_¡d;d;+1), y repetir el proceso. 
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Queremos determinar si alguna de las estrategias propuestas encuentra siempre 
solución óptima. Como es habitual en los algoritmos ávidos para comprobar su 
funcionamiento, sería necesario una demostración formal o bien dar un 
contraejemplo que justifique la respuesta. 


Solución (O) 


Lamentablemente, ninguna de las estrategias presentadas encuentra la solución 
óptima. Por tanto, para todas es posible dar un contraejemplo en donde el algoritmo 
falla. 


a) La primera estrategia consiste en multiplicar siempre primero las matrices 
M; M;+, cuya dimensión común d; es la menor entre todas. Pero observando el 
ejemplo anterior esta estrategia se muestra errónea, pues corresponde al 
producto (M¡M>,1(M3M4), que resulta ser el peor de todos. 


b) Si multiplicamos siempre primero las matrices MM;,, cuya dimensión común d; 
es la mayor entre todas encontramos la solución óptima para el ejemplo anterior, 
pero existen otros ejemplos donde falla esta estrategia, como el siguiente: 


Sean M¡(QXx5), M(5x4) y M3(4x1). Según esta estrategia, el producto escogido 
como mejor sería (M¡M>)M5, con un coste de 48 (2-5:4 + 2:4-1). Sin embargo, el 
producto M.¡(M,M5) tiene un coste asociado de 30 (5:4-1 + 2-5:1), menor que el 
anterior. 


c) Si decidimos realizar siempre primero la multiplicación de las matrices M; M1 
que requiera menor número de operaciones, encontraríamos la solución óptima 
para los dos ejemplos anteriores, pero no para el siguiente: 


Sean M¡Gx1), MA(1x100) y Mí(100x5). Según esta estrategia, el producto 
escogido como mejor sería (M,M>)M3, de coste 1.800 (3-1:100 + 3-100-5). Sin 
embargo, el coste del producto M¡(M,M5) es de 515 (1:100:5 + 3-1:5), menor 
que el anterior. 


d) Análogamente, realizando siempre primero la multiplicación de las matrices 
M; M1 que requiera mayor número de operaciones vamos a encontrar la 
solución óptima para este último ejemplo, pero no para los dos primeros. 


